Entrepôts de données sur grilles de calcul
نویسندگان
چکیده
Résumé Les entrepôts de données sont utilisés pour l'exploitation et l'analyse de grands volumes de données extraits des systèmes d'informations en exploitation. Un modèle multidimensionnel organise l'entrepôt de données selon plusieurs axes d'analyse appelés « dimensions ». Les systémes OLAP (OnLine Analytical Processing) permettent une exploration interactive des données contenues dans un entrepôt. Pour satisfaire les besoins croissants en volume de stockage et en capacité de traitement, les entrepôts de données ont été adaptés aux infrastructures de systèmes répartis offrant des possibilités de répartition intelligente des données et de traitements parallèles. Les grilles de calcul forment une classe à part parmi les systèmes répartis car elles réunissent des ressources hétérogènes distantes à l'aide de services d'abstraction et sont souvent entièrement dépourvues de gestion centrale. Les problèmes à résoudre pour une réalisation d'entrepôt de données sur grilles de calcul concernent l'identification des données d'un entrepôt nécessaire à leur échange entre noeuds d'une grille, la répartition et l'indexation de l'entrepôt de données au sein de la grille et le traitement des requêtes OLAP.
منابع مشابه
Service de Cache pour les Grilles de Calcul
Résumé. Nous proposons un système fédérateur de caches pour les grilles que les applications de la grille utilisent comme un service de cache uniforme. Le système est fondé sur le concept de l'activité de données où les applications partagent et réutilisent l'information sémantique liée à l'activité des données sous la forme de métadonnées. Ces métadonnées représentent la connaissance sur les d...
متن کاملJUXMEM : un service de partage transparent de données pour grilles de calcul fondé sur une approche pair-à-pair
HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau...
متن کاملDétection de consensus entre sources et calcul de confiance fondé sur l'intégrale de Choquet
Résumé : Aujourd’hui de nombreux entrepôts sont disponibles sur le Web de données liées pour un même domaine d’intérêt. Ces entrepôts peuvent être de qualité variable ce qui rend difficile leur réutilisation. Dans cet article, nous présentons une approche permettant d’identifier la connaissance partagée par différents entrepôts en favorisant la connaissance issue de sources de qualité. L’approc...
متن کاملDu Calcul Séquentiel au Cloud Computing
Deux nouveaux concepts de calcul sont en train de modifier le monde informatique, comme l’a fait Internet à partir des années 80 : ce sont les concepts de «Grilles de calcul et de données» (Grid Computing et Datagrid) et de « Calcul dans les nuages » (Cloud Computing). Ils sont apparus pour répondre à une demande croissante des scientifiques et des industriels en puissance de calcul, en ressour...
متن کاملC-CUBE: Un nouvel opérateur d'agrégation pour les entrepôts de données en colonnes
RÉSUMÉ. Les bases de données orientées colonnes offrent au domaine décisionnel le modèle le plus approprié au stockage des entrepôts de données. Cependant, en l’absence d’opérateurs d’analyse en ligne, le seul moyen, très coûteux, qui existe pour construire des cubes OLAP consiste à utiliser l’opérateur UNION sur des requêtes de regroupement afin d’obtenir l’ensemble des Group By nécessaires au...
متن کامل